#!/bin/bash
#这个脚本用tfidf的方式增量更新问题的相关问题
#步骤如下：
#1、获得需要更新相关问题的标题和内容
#2、对该问题进行分词
#3、计算这个问题的tf_idf值
#4、计算这个问题与其他同年龄段的其他问题的相关度
#5、对以上内容进行排序，排序完毕，取出最相关的问题
#6、恢复相关问题的原始id
#7、将最相关的问题存在TT中,以"q_detail_rsim_"为前缀
#8、将新问题的tf，idf值加入到老问题中（如果新增term，则同时增加termId）
#9、end, enjoy it!
echo "step1: get question title and content from db"
curPath=${PWD}
mysql=`which mysql`
maxIdFile=$curPath"/maxId"
#get maxId dealed lastTime
maxId=`cat $maxIdFile`
value=`$mysql $DBName -u root -se 'select * from stars' | sed '1d'`
$mysql -Dbabytree -umysql_baby -pbaidugoogleyahoo -h192.168.1.33 -e "select q.id, q.current_age, q.title, c.content from Question q left join QuestionContent c on q.id = c.id where q.type != 'deleted_admin' and " > all_question_normal
